Wprowadzenie
1. WstÄp
2. Zmienne w zbiorze danych
âą Age - wiek uĆŒytkownika siĆowni.
âą Gender - pĆeÄ uĆŒytkownika siĆowni.
âą Weight (kg)- waga uĆŒytkownika siĆowni w kilogramach.
âą Height (m) - wzrost uĆŒytkownika siĆowni w metrach.
âą Max_BPM - maksymalne tÄtno podczas sesji treningowych.
âą Avg_BPM - Ćrednie tÄtno podczas sesji treningowych.
âą Resting_BPM - spoczynkowe tÄtno przed treningiem.
âą Session_Duration - czas trwania kaĆŒdej sesji treningowej w godzinach.
âą Calories_Burned - caĆkowita liczba kalorii spalonych podczas kaĆŒdej sesji.
âą Workout_Type - rodzaj wykonanego treningu (np. kardio, siĆowy, joga, HIIT).
âą Fat_Percentage -procent tkanki tĆuszczowej.
âą Water_Intake - spoĆŒycie wody podczas treningu w litrach.
âą Workout_Frequency - liczba sesji treningowych w tygodniu.
âą Experience_Level - poziom doĆwiadczenia, od poczÄ tkujÄ cego (1) do eksperta (3).
âą BMI - wskaĆșnik masy ciaĆa, obliczany na podstawie wzrostu i wagi.
3. Struktura danych
| Nazwa zbioru danych | silownia |
| Liczba wierszy | 973 |
| Liczba kolumn | 15 |
| Kolumny typu tekstowego | 2 |
| Kolumny typu liczbowego | 13 |
Kolumny typu tekstowego
| Kolumna | BrakujÄ ce wartoĆci | KompletnoĆÄ | Min | Max | Puste | Unikalne wartoĆci | Whitespace |
|---|---|---|---|---|---|---|---|
| PĆeÄ | 0 | 1.00 | 4 | 6 | 0 | 2 | 0 |
| Typ treningu | 150 | 0.85 | 4 | 8 | 0 | 4 | 0 |
Kolumny typu liczbowego
| Kolumna | BrakujÄ ce wartoĆci | KompletnoĆÄ | Ćrednia | Odchylenie standardowe | 0 Percentyl | 25 Percentyl | 50 Percentyl | 75 Percentyl | 100 Percentyl | Histogram |
|---|---|---|---|---|---|---|---|---|---|---|
| Wiek | 100 | 0.90 | 38.63 | 12.27 | 18.00 | 28.00 | 39.00 | 50.00 | 59.00 | âââââ |
| Waga | 0 | 1.00 | 73.85 | 21.21 | 40.00 | 58.10 | 70.00 | 86.00 | 129.90 | â ââ ââ |
| Wzrost | 0 | 1.00 | 1.72 | 0.13 | 1.50 | 1.62 | 1.71 | 1.80 | 2.00 | â ââââ |
| Maksymalne tÄtno | 0 | 1.00 | 179.88 | 11.53 | 160.00 | 170.00 | 180.00 | 190.00 | 199.00 | âââââ |
| Ćrednie tÄtno | 0 | 1.00 | 143.77 | 14.35 | 120.00 | 131.00 | 143.00 | 156.00 | 169.00 | âââââ |
| Spoczynkowe tÄtno | 0 | 1.00 | 62.22 | 7.33 | 50.00 | 56.00 | 62.00 | 68.00 | 74.00 | âââââ |
| Czas trwania sesji | 0 | 1.00 | 1.26 | 0.34 | 0.50 | 1.04 | 1.26 | 1.46 | 2.00 | ââ âââ |
| Spalone kalorie | 0 | 1.00 | 905.42 | 272.64 | 303.00 | 720.00 | 893.00 | 1076.00 | 1783.00 | âââââ |
| Procent tkanki tĆuszczowej | 0 | 1.00 | 24.98 | 6.26 | 10.00 | 21.30 | 26.20 | 29.30 | 35.00 | âââ ââ |
| SpoĆŒycie wody | 0 | 1.00 | 2.63 | 0.60 | 1.50 | 2.20 | 2.60 | 3.10 | 3.70 | âââââ |
| CzÄstotliwoĆÄ treningĂłw | 0 | 1.00 | 3.32 | 0.91 | 2.00 | 3.00 | 3.00 | 4.00 | 5.00 | â ââââ |
| Poziom doĆwiadczenia | 0 | 1.00 | 1.81 | 0.74 | 1.00 | 1.00 | 2.00 | 2.00 | 3.00 | âââââ |
| BMI | 150 | 0.85 | 24.82 | 6.60 | 12.32 | 20.10 | 23.94 | 28.45 | 47.72 | âââ ââ |
4. WstÄpne przygotowanie danych
Przed rozpoczÄ ciem procesu Data Wranglingu pobraliĆmy i zainstalowaliĆmy wszystkie niezbÄdne pakiety potrzebne do naszej analizy. Kolejnym krokiem byĆa zmiana nazw kolumn z :
Weight (kg) na Weight_kg
Height (m) na Height_m
Session_Duration (hours) na Session_Duration_hours
Water_Intake (liters) na Water_Intake_liters
Workout_Frequency (days/week) na Workout_Frequency_daysweek
Data Wrangling
Data Wrangling jest to proces polegajÄ cy na przeksztaĆceniu nieuporzÄ dkowanego zbioru danych w uĆŒyteczny oraz uporzÄ dkowany. To zĆoĆŒone dziaĆanie, ktĂłre zaczyna siÄ od zrozumienia struktury danych i identyfikacji problemĂłw, a koĆczy na stworzeniu uporzÄ dkowanego zbioru gotowego do dalszej analizy.
Kluczowymi etapami tego procesu bÄdzie:
poznanie obserwacji odstajÄ cych, czyli danych ktĂłre w znaczÄ cy sposĂłb rĂłĆŒniÄ siÄ od reszty zbioru
przeanalizowanie brakĂłw danych, w ktĂłrym poznamy iloĆÄ brakĂłw, ich rozmieszczenie, a takĆŒe czy wystÄpuje wspĂłĆzaleĆŒnoĆÄ miÄdzy nimi
imputacja brakĂłw danych, polegajÄ ca na zastÄ pieniu brakĂłw za pomocÄ metod imputacji
walidacja danych, czyli sprawdzenie czy dane sÄ Â wolne od bĆÄdĂłw
1. Obserwacje odstajÄ ce
Obserwacje odstajÄ ce to dane, ktĂłre znaczÄ co rĂłĆŒniÄ siÄ od reszty zbioru, co moĆŒe wynikaÄ z bĆÄdĂłw pomiaru, specyfiki badanego zjawiska lub innych nietypowych czynnikĂłw. W celu poznania obserwacji odstajÄ cych w naszym zbiorze danych zastowaliĆmy wykres ramkowy (box plot), pozwalajÄ cy na wizualne wykrycie wartoĆci wykraczajÄ cych poza typowy zakres danych.
Wiek
Zmienna Wiek nie posiada obserwacji odstajÄ cych.
Waga
Zmienna Waga posiada odstajÄ ce obserwacje (gĂłrne outliery), czyli obserwacje, ktĂłre znajdujÄ siÄ o wiÄcej niĆŒ 1,5 rozstÄpu Äwiartkowego powyĆŒej trzeciego kwartyla.
Wzrost
Zmienna Wzrost nie ma obserwacji odstajÄ cych.
Maksymalne tÄtno
Zmienna Maksymalne tÄtno nie posiada obserwacji odstajÄ cych.
Ćrednie tÄtno
Zmienna Ćrednie tÄtno nie ma obserwacji odstajÄ cych.
TÄtno spoczynkowe
Zmienna TÄtno spoczynkowe nie ma obserwacji odstajÄ cych.
Czas trwania sesji
Zmienna Czas trwania sesji nie posiada obserwacji odstajÄ cych.
Spalone kalorie
Zmienna Spalone kalorie posiada gĂłrne outliery, czyli obserwacje, ktĂłre znajdujÄ siÄ o wiÄcej niĆŒ 1,5 rozstÄpu Äwiartkowego powyĆŒej trzeciego kwartyla.
Procent tkanki tĆuszczowej
Zmienna Procent tkanki tĆuszczowej nie ma obserwacji odstajÄ cych.
IloĆÄ wypitej wody
Zmienna IloĆÄ wypitej wody nie posiada obserwacji odstajÄ cych.
CzÄstotliwoĆÄ treningĂłw
Zmienna CzÄstotliwoĆÄ treningĂłw nie posiada obserwacji odstajÄ cych.
BMI
W przypadku zmiennej BMI wystÄpujÄ gĂłrne outliery, czyli obserwacje, ktĂłre znajdujÄ siÄ o wiÄcej niĆŒ 1,5 rozstÄpu Äwiartkowego powyĆŒej trzeciego kwartyla.
Podsumowanie
Za pomocÄ wykresu ramkowego wykazano, ĆŒe w przypadku zmiennych Waga, Spalone kalorie oraz BMI wystÄpujÄ gĂłrne outliery,czyli obserwacje, ktĂłre znajdujÄ siÄ o wiÄcej niĆŒ 1,5 rozstÄpu Äwiartkowego powyĆŒej trzeciego kwartyla. Ć»adna zmienna natomiast nie posiada ekstremalnych obserwacji odstajÄ cych.
2. Analiza brakĂłw danych
Analiza brakĂłw danych jest kluczowym etapem przygotowania zbioru danych do dalszej analizy. W ramach tego procesu okreĆlimy liczbÄ brakĂłw w zbiorze, przeanalizujemy ich rozmieszczenie oraz sprawdzimy, czy wystÄpujÄ korelacje miÄdzy brakami w rĂłĆŒnych zmiennych. Wyniki tej analizy posĆuĆŒÄ jako podstawa do podjÄcia decyzji o dalszym postÄpowaniu z brakujÄ cymi danymi.
WstÄpna analiza brakĂłw danych
Sprawdzenie gdzie wystÄpujÄ braki danych i procentowo ile ich jest
W caĆej bazie danych brakuje 2,7% danych.
Braki danych wystÄpujÄ w kolumnie Typ treningu, Wiek oraz BMI.
Ile brakĂłw jest w poszczegĂłlnych kolumnach
Kolumna Wiek ma 100 brakĂłw.
Kolumna Typ treningu ma 150 brakĂłw.
Kolumna BMI ma 150 brakĂłw.
WystÄpowanie brakĂłw w wierszach
| Liczba NA w wierszu | Liczba wierszy | Procent wszystkich wierszy |
|---|---|---|
| 0 | 631 | 64,85% |
| 1 | 287 | 29,50% |
| 2 | 52 | 5,34% |
| 3 | 3 | 0,31% |
631 wierszy ma 0 NA
287 wierszy ma 1 NA
115 w Typ treningu
106 w BMI
66 w Wiek
52 wiersze ma 2 NA
21 wierszy w Typ treningu i BMI
20 wierszy w Wiek i BMI
11 w Wiek i Typ treningu
3 wiersze majÄ 3 NA
Sprawdzanie korelacji miÄdzy brakami danych
1. Wiek i BMI
Braki w kolumnie BMI sÄ caĆkowicie niezaleĆŒne od wartoĆci w kolumnie Wiek.
Z kolei braki w kolumnie Wiek sÄ raczej niezaleĆŒne od wartoĆci BMI, choÄ zauwaĆŒono nieco wiÄkszÄ liczbÄ brakĂłw w przypadku niĆŒszych wartoĆci BMI.
2. Typ treningu i BMI
Braki w kolumnie BMI sÄ caĆkowicie niezaleĆŒne od wartoĆci w kolumnie Typ treningu.
Z kolei braki w kolumnie Typ treningu sÄ raczej niezaleĆŒne od wartoĆci BMI, choÄ zauwaĆŒono nieco wiÄkszÄ liczbÄ brakĂłw w przypadku niĆŒszych wartoĆci BMI.
3. Typ treningu i Wiek
Braki w obu kolumnach sÄ caĆkowicie niezaleĆŒne od siebie.
3. Imputacja brakĂłw danych
W procesie analizy brakĂłw danych napotkaliĆmy na brakujÄ ce wartoĆci (NA) w kolumnach Wiek, BMI oraz Typ treningu. Aby zapewniÄ spĂłjnoĆÄ i peĆnoĆÄ danych, postanowiliĆmy przeprowadziÄ imputacjÄ brakĂłw, czyli zastÄ pienie brakujÄ cych wartoĆci odpowiednimi danymi.
Kolumna BMI
Braki w kolumnie postanowaliĆmy zastÄ piÄ za pomocÄ wzoru na BMI.
\[ BMI = \frac{waga}{wzrost^2} \]
silownia$BMI <- ifelse(
is.na(silownia$BMI),
silownia$Weight_kg / (silownia$Height_m^2),
silownia$BMI )
WybraliĆmy wzĂłr na BMI jako metodÄ uzupeĆniania brakĂłw, poniewaĆŒ opiera siÄ on na dwĂłch kluczowych zmiennych: wadze i wzroĆcie, ktĂłre w naszym zbiorze danych sÄ kompletne. DziÄki temu obliczenie BMI za pomocÄ Â wzrou jest najbardziej rzetelnÄ metodÄ imputacji, gdyĆŒ wykorzystuje dostÄpne, peĆne informacje do oszacowania brakujÄ cych wartoĆci.
Kolumna Typ treningu i Wiek
W przypadku kolumny Typ treningu i Wiek zdecydowaliĆmy przeprowadziÄ imputacjÄ na kilka sposĂłb, a nastÄpnie wybraÄ najlepszÄ Â moĆŒliwoĆÄ.
1. Imputacja metodÄ k-Nearest Neighbors (kNN)
silownia_kNN <- kNN(silownia, k = 3)
2. Imputacja z pakietem Mice
if (!is.factor(silownia$Workout_Type)) {
silownia$Workout_Type <- factor(silownia$Workout_Type, levels = c("Yoga", "Cardio", "HIIT", "Strength"))
}
metody <- make.method(silownia)
metody["Age"] <- "pmm"
metody["Workout_Type"] <- "polyreg"
metody["BMI"] <- ""
pred_mat <- make.predictorMatrix(silownia)
pred_mat["BMI", ] <- 0 # WyĆÄ
cz imputacjÄ dla BMI
pred_mat[, "BMI"] <- 1 # BMI jako predyktor dla innych kolumn
silownia_imp <- mice(silownia, m = 5, method = metody, predictorMatrix = pred_mat, seed = 123)
lm_imp <- with(silownia_imp, lm(BMI ~ Weight_kg + Gender))
lm_pooled <- pool(lm_imp)
summary(lm_pooled, conf.int = TRUE, conf.level = 0.95)
stripplot(silownia_imp, BMI ~ Weight_kg | .imp, pch = 20, cex = 2)
silownia_mice <- complete(silownia_imp, action = 1)
3. Imputacja hot-deck
silownia_hotdeck <- hotdeck(silownia)
4. Imputacja RPART
silownia_rpart <- silownia %>%
mutate(Workout_Type = case_when(
Workout_Type == "Yoga" ~ 1,
Workout_Type == "Cardio" ~ 2,
Workout_Type == "HIIT" ~ 3,
Workout_Type == "Strength" ~ 4,
TRUE ~ as.numeric(Workout_Type)
))
silownia_rpart <- silownia_rpart %>%
mutate(Gender = case_when(
Gender == "Male" ~ 1,
Gender == "Female" ~ 2,
TRUE ~ as.numeric(Gender)
))
drzewo_decyzyjne1 <- rpart(Workout_Type ~ Age + BMI + Max_BPM + Weight_kg + Height_m + Avg_BPM + Resting_BPM +
Session_Duration_hours + Calories_Burned +
Fat_Percentage + Water_Intake_liters +
Workout_Frequency_daysweek + Gender + Experience_Level, data = silownia_rpart, method = "anova", na.action = na.exclude)
silownia_rpart$Workout_Type[is.na(silownia_rpart$Workout_Type)] <- predict(drzewo_decyzyjne1, newdata = silownia_rpart[is.na(silownia_rpart$Workout_Type), ])
drzewo_decyzyjne2 <- rpart(Age ~ BMI + Workout_Type + Gender + Max_BPM + Weight_kg + Height_m + Avg_BPM + Resting_BPM +
Session_Duration_hours + Calories_Burned +
Fat_Percentage + Water_Intake_liters +
Workout_Frequency_daysweek + Experience_Level, data = silownia_rpart, method = "anova", na.action = na.exclude)
silownia_rpart$Age[is.na(silownia_rpart$Age)] <- predict(drzewo_decyzyjne2, newdata = silownia_rpart[is.na(silownia_rpart$Age), ])
WybĂłr metody
ZdecydowaliĆmy siÄ zastÄ piÄ braki danych wystÄpujÄ ce w kolumnach Wiek i Typ treningu za pomocÄ metody hot-deck, poniewaĆŒ jest to podejĆcie, ktĂłre pozwala na imputacjÄ brakujÄ cych wartoĆci w sposĂłb uwzglÄdniajÄ cy podobieĆstwo do istniejÄ cych danych. DziÄki tej metodzie wartoĆci brakujÄ ce sÄ zastÄpowane rzeczywistymi danymi z innych obserwacji o podobnych cechach,
4. Walidacja danych
Po zakoĆczeniu procesu uzupeĆniania brakĂłw w naszych danych, kolejnym krokiem w przygotowywaniu ich do dalszej analizy jest ich walidacja. Ten etap pozwala sprawdziÄ czy dane, sÄ wolne od bĆÄdĂłw, niespĂłjnoĆci i nieĆcisĆoĆci, ktĂłre mogĆyby negatywnie wpĆynÄ Ä na dalszÄ pracÄ z nimi. Walidacja danych obejmuje zarĂłwno sprawdzenie poprawnoĆci logicznej, strukturalnej, jak i identyfikacjÄ potencjalnych anomalii czy niezgodnoĆci z przyjÄtymi zaĆoĆŒeniami.
Wiek
WartoĆci w kolumnie Wiek powinny byÄ liczbami caĆkowitymi mieszczÄ cymi siÄ w przedziale od 0 do 110 wĆÄ cznie.
PĆeÄ
Kolumna PĆeÄ przyjmuje wartoĆÄ Female albo Male.
Waga
WartoĆci w kolumnie Waga powinny byÄ liczbami mieszczÄ cymi siÄ w przedziale od 40 kg do 140 kg wĆÄ cznie.
Wzrost
W kolumnie Wzrost powinny znajdowaÄ siÄ wartoĆci liczbowe z zakresu od 1.30 m do 2.15 m wĆÄ cznie.
Maksymalne tÄtno
Kolumna Maksymalne tÄtno musi posiadaÄ wartoĆci, ktĂłre sÄ liczbami z zakresu od 110 do 210 wĆÄ cznie.
Ćrednie tÄtno
WartoĆci w kolumnie Ćrednie tÄtno powinny byÄ liczbami mieszczÄ cymi siÄ w przedziale od 80 do 180 wĆÄ cznie.
Spoczynkowe tÄtno
W kolumnie Spoczynkowe tÄtno powinny znajdowaÄ siÄ wartoĆci liczbowe z zakresu od 45 do 130 wĆÄ cznie.
Czas trwania sesji
WartoĆci w kolumnie Czas trwania sesji powinny byÄ dodatnimi liczbami nieprzekraczajÄ cymi 2.
Spalone kalorie
WartoĆci powinny byÄ dodatnimi liczbami nieprzekraczajÄ cymi 2000.
Typ treningu
Kolumna Typ treningu powinna zawieraÄ tylko takie wartoĆci jak: Yoga, Cardio, HIIT oraz Strength.
Procent tkanki tĆuszczowej
WartoĆci w kolumnie Procent tkanki tĆuszczowej powinny byÄ liczbami dodatnimi nieprzekraczajÄ cymi 50.
IloĆÄ wypitej wody
WartoĆci powinny byÄ liczbami dodatnimi nieprzekraczajÄ cymi 4.
CzÄstotliwoĆÄ treningĂłw
Kolumna CzÄtotliwoĆÄ treningĂłw powinna zawieraÄ tylko takie wartoĆci jak: 0, 1, 2, 3, 4, 5, 6, 7.
Poziom doĆwiadczenia
Kolumna Poziom doĆwiadczenia powinna zawieraÄ tylko takie wartoĆci jak: 0, 1, 2, 3.
BMI
WartoĆci w kolumnie BMI powinny byÄ dodatnimi liczbami mieszczÄ cymi siÄ w przedziale od 10 do 60 wĆÄ cznie, a ich rĂłĆŒnica wzglÄdem wartoĆci obliczonej jako Weight_kg/Height_m^2 powinna byÄ mniejsza niĆŒ 0.1.â
Podsumowanie
W naszym zbiorze danych nie wystÄ piĆy ĆŒadne bĆÄdy, wiÄc jest on gotowy do przeprowadzenie wizualizacji oraz dalszej analizy.
Wizualizacja danych i analiza opisowa
Kolejnym etapem naszej pracy jest wizualcja danych, a takĆŒe ich analiza opisowa.
RozkĆad pĆci
Wykres pokazuje rĂłwnomierny rozkĆad pĆci w analizowanym zbiorze danych. Widoczna jest zbliĆŒona liczba kobiet i mÄĆŒczyzn, z niewielkÄ przewagÄ mÄĆŒczyzn, okoĆo 500 osĂłb w kaĆŒdej grupie.
RozkĆad wieku w zaleĆŒnoĆci od pĆci
Wykres przedstawia rozkĆad wieku w zaleĆŒnoĆci od podanej pĆci. ZauwaĆŒyÄ moĆŒna wiÄkszy udziaĆ mÄĆŒczyzn w grupie wiekowej 25-39 lat. Z kolei w grupie 40-55 lat przewaĆŒyĆa pĆeÄ ĆŒeĆska.
Statystyki opisowe zmiennej wiek w zaleĆŒnoĆci od pĆci
| Statystyka | Kobiety | MÄĆŒczyĆșni |
|---|---|---|
| Min | 18 | 18 |
| Max | 59 | 59 |
| Kwartyl dolny | 27 | 28.5 |
| Mediana | 39 | 39 |
| Kwartyl gĂłrny | 50 | 49 |
| Ćrednia | 38.34 | 38.76 |
| Odch. std. | 12.47 | 12.05 |
| IQR | 23 | 20.5 |
| Odchylenie Äwiartkowe | 11.5 | 10.25 |
| Odch. std. w % | 0.33 | 0.31 |
| Odch. Äwiartkowe w % | 0.59 | 0.53 |
| SkoĆnoĆÄ | -0.08 | -0.05 |
| Kurtoza | -1.28 | -1.19 |
ZaleĆŒnoĆÄ BMI od wieku
Wykres pokazuje, jakie wartoĆci wskaĆșnika BMI osiÄ gano dla danego wieku. Dodano takĆŒe liniÄ trendu, ktĂłra zostaĆa oszacowana na poziomie BMI = 25.
Statystyki opisowe zmiennej BMI w zaleĆŒnoĆci od wieku
| Statystyka | 18-29 | 29-39 | 39-49 | 49-59 |
|---|---|---|---|---|
| Min | 12.73 | 12.67 | 12.32 | 12.47 |
| Max | 45.14 | 48.4301173601585 | 49.843756027931 | 47.72 |
| Kwartyl dolny | 20.335 | 20.649533029469 | 19.69 | 19.67 |
| Mediana | 24.68 | 24.11 | 23.16 | 24.31 |
| Kwartyl gĂłrny | 29.02 | 29.5951033057851 | 26.64 | 28.97 |
| Ćrednia | 25.3 | 25.4 | 23.84 | 24.94 |
| Odch. std. | 6.51 | 6.79 | 6.41 | 6.79 |
| IQR | 8.69 | 8.95 | 6.95 | 9.3 |
| Odchylenie Äwiartkowe | 4.34 | 4.47 | 3.47 | 4.65 |
| Odch. std. w % | 0.13 | 0.11 | 0.11 | 0.11 |
| Odch. Äwiartkowe w % | 0.2 | 0.21 | 0.17 | 0.21 |
| SkoĆnoĆÄ | 0.62 | 0.84 | 1.06 | 0.63 |
| Kurtoza | 0.28 | 0.81 | 1.94 | 0.3 |
Na podstawie powyĆŒszych wynikĂłw moĆŒna stwierdziÄ, ĆŒe najwyĆŒszÄ ĆredniÄ wartoĆÄ BMI osiÄ gniÄto dla grupy wiekowej 18-29 lat, dla ktĂłrej najwiÄksza jest teĆŒ mediana BMI rĂłwna 24,96. Minimalna wartoĆÄ BMI to 12,32 dla osĂłb w wieku 39-49 lat, a maksymalna wynosi niespeĆna 50 dla tej samej grupy wiekowej. W grupie wiekowej 49-59 nastÄ piĆo najwiÄksze rozproszenie danych. WyniosĆo ono 7,1. RozstÄp miÄdzykwartylowy (IQR) osiÄ ga wartoĆci od 7,08 do 9,08, co wskazuje na stabilnoĆÄ w centralnej czÄĆci rozkĆadu. RozkĆad BMI jest lekko dodatnio skoĆny. WartoĆci Bmi wiÄksze od Ćredniej sÄ nieco bardziej rozproszone. WartoĆci kurtozy wskazujÄ na to, ĆŒe dane sÄ bardziej rozproszone, a wyniki nie wykazujÄ silnej koncentracji wokĂłĆ Ćredniej ani wielu skrajnych wartoĆci.
RozkĆad wagi w zaleĆŒnoĆci od pĆci
RozkĆad wagi u kobiet jest bardziej skoncentrowany w przedziale 50â70 kg, co wskazuje na mniejszÄ zmiennoĆÄ i wiÄkszÄ jednolitoĆÄ w populacji kobiet.
RozkĆad wagi u mÄĆŒczyzn jest szerszy, co oznacza wiÄkszÄ zmiennoĆÄ. Wagi mÄĆŒczyzn najczÄĆciej mieszczÄ siÄ w przedziale 70â90 kg, ale rozkĆad ma dĆuĆŒszy ogon w kierunku wyĆŒszych wartoĆci, siÄgajÄ c ponad 120 kg.
OgĂłlnie, mÄĆŒczyĆșni wykazujÄ wiÄksze zrĂłĆŒnicowanie wag w porĂłwnaniu do kobiet, z tendencjÄ do wyĆŒszych wartoĆci wagi. RozkĆady sÄ symetryczne, z wyraĆșnymi rĂłĆŒnicami miÄdzy Ćrednimi i zakresami wag dla obu pĆci.
Statystyki opisowe zmiennej wagi w zaleĆŒnoĆci od pĆci
| Statystyka | Kobiety | MÄĆŒczyĆșni |
|---|---|---|
| Min | 40 | 45 |
| Max | 79.9 | 129.9 |
| Kwartyl dolny | 54.05 | 69.75 |
| Mediana | 61.35 | 85.3 |
| Kwartyl gĂłrny | 69.175 | 101.6 |
| Ćrednia | 60.94 | 85.53 |
| Odch. std. | 10.24 | 21.79 |
| IQR | 15.13 | 31.85 |
| Odchylenie Äwiartkowe | 7.56 | 15.92 |
| Odch. std. w % | 0.17 | 0.25 |
| Odch. Äwiartkowe w % | 0.25 | 0.37 |
| SkoĆnoĆÄ | -0.16 | 0.15 |
| Kurtoza | -0.81 | -0.73 |
Waga kobiet waha siÄ od 40 do 79,9 kg. Mediana wynosi 61,35 kg, a Ćrednia 60,94 kg, co wskazuje na zbliĆŒone wartoĆci centralne. RozstÄp miÄdzykwartylowy (IQR) wynosi 15,13, a odchylenie standardowe 10,24, co wskazuje na umiarkowanÄ zmiennoĆÄ wagi w tej grupie. SkoĆnoĆÄ (-0,16) wskazuje na lekko ujemny rozkĆad, co oznacza, ĆŒe czÄĆciej wystÄpujÄ wyĆŒsze wartoĆci wagi, a kurtoza (-0,81) sugeruje spĆaszczony rozkĆad.
Waga mÄĆŒczyzn jest bardziej zrĂłĆŒnicowana i waha siÄ od 45 do 129,9 kg. Mediana wynosi 85,3 kg, a Ćrednia 85,53 kg, co oznacza, ĆŒe wiÄkszoĆÄ wartoĆci oscyluje wokĂłĆ tego przedziaĆu. RozstÄp miÄdzykwartylowy (IQR) wynosi 31,85, a odchylenie standardowe 21,79, co wskazuje na wiÄksze zrĂłĆŒnicowanie wagi niĆŒ w przypadku kobiet. SkoĆnoĆÄ (0,15) sugeruje lekko dodatni rozkĆad, co oznacza, ĆŒe czÄĆciej wystÄpujÄ niĆŒsze wartoĆci wagi, a kurtoza (-0,73) rĂłwnieĆŒ wskazuje na spĆaszczony rozkĆad.
PodsumowujÄ c, kobiety majÄ mniejsze zrĂłĆŒnicowanie wagi w porĂłwnaniu do mÄĆŒczyzn, ktĂłrych wagi rozkĆadajÄ siÄ na szerszym przedziale. Mediana i Ćrednia wagi sÄ wyĆŒsze u mÄĆŒczyzn. RozkĆady w obu grupach sÄ lekko spĆaszczone, ale rĂłĆŒniÄ siÄ kierunkiem skoĆnoĆci.
Czas trwania sesji a spalone kalorie
Statystyki opisowe dla spalonych kalorii w zaleĆŒnoĆci od dĆugoĆci trwania sesji treningowej
| Statystyka | 0,5-1h | 1-1,5h | 1,5-2h |
|---|---|---|---|
| Min | 303 | 576 | 837 |
| Max | 832 | 1385 | 1783 |
| Kwartyl dolny | 446 | 793 | 1134 |
| Mediana | 534.5 | 888 | 1240 |
| Kwartyl gĂłrny | 632 | 1005.5 | 1372.5 |
| Ćrednia | 540.77 | 902.47 | 1258.46 |
| Odch. std. | 115.7 | 150.64 | 187.41 |
| IQR | 186 | 212.5 | 238.5 |
| Odchylenie Äwiartkowe | 93 | 106.25 | 119.25 |
| Odch. std. w % | 0.21 | 0.17 | 0.15 |
| Odch. Äwiartkowe w % | 0.35 | 0.24 | 0.19 |
| SkoĆnoĆÄ | 0.18 | 0.32 | 0.34 |
| Kurtoza | -0.77 | -0.37 | -0.14 |
0,5â1 godz.: Liczba spalonych kalorii waha siÄ od 303 do 832, z medianÄ 534,5 i ĆredniÄ 540,77. RozstÄp miÄdzykwartylowy (IQR) wynosi 186, co wskazuje na umiarkowanÄ zmiennoĆÄ w centralnej czÄĆci rozkĆadu. Odchylenie standardowe wynosi 115,7, co oznacza niewielkie zrĂłĆŒnicowanie wartoĆci. RozkĆad jest lekko dodatnio skoĆny (0,18), co oznacza, ĆŒe wartoĆci wyĆŒsze od Ćredniej pojawiajÄ siÄ rzadziej.
1â1,5 godz.: Liczba spalonych kalorii wzrasta, waha siÄ od 576 do 1385, z medianÄ 888 i ĆredniÄ 902,47. RozstÄp miÄdzykwartylowy (IQR) wynosi 212,5, co oznacza wiÄkszÄ zmiennoĆÄ niĆŒ w poprzedniej kategorii. Odchylenie standardowe to 150,64, co wskazuje na wiÄksze zrĂłĆŒnicowanie wynikĂłw. SkoĆnoĆÄ (0,32) jest nieco wyĆŒsza, co wskazuje na wiÄkszÄ asymetriÄ w kierunku wyĆŒszych wartoĆci.
1,5â2 godz.: Liczba spalonych kalorii jest najwyĆŒsza, od 837 do 1783, z medianÄ 1240 i ĆredniÄ 1258,46. RozstÄp miÄdzykwartylowy (IQR) wynosi 238,5, a odchylenie standardowe 187,41, co wskazuje na najwiÄkszÄ zmiennoĆÄ w tej grupie. SkoĆnoĆÄ (0,34) jest podobna do poprzedniej grupy, sugerujÄ c asymetriÄ w kierunku wyĆŒszych wartoĆci.
PodsumowujÄ c, wraz ze wzrostem czasu trwania sesji roĆnie liczba spalonych kalorii, zarĂłwno pod wzglÄdem wartoĆci minimalnych, Ćrednich, jak i maksymalnych. JednoczeĆnie wzrasta zmiennoĆÄ wynikĂłw (odchylenie standardowe i IQR), co sugeruje, ĆŒe dĆuĆŒsze sesje treningowe prowadzÄ do bardziej zrĂłĆŒnicowanych rezultatĂłw w spalaniu kalorii. RozkĆad w kaĆŒdej kategorii jest lekko dodatnio skoĆny, z tendencjÄ do wiÄkszego spĆaszczenia w miarÄ wydĆuĆŒania sesji (kurtoza od -0,77 do -0,14).
Spalone kalorie a waga
Wykres przedstawia zaleĆŒnoĆÄ miÄdzy wagÄ a liczbÄ spalonych kalorii. Punkty danych pokazujÄ duĆŒÄ zmiennoĆÄ w liczbie spalonych kalorii wĆrĂłd osĂłb o podobnej wadze, jednak trend zaznaczony liniÄ regresji sugeruje niewielkÄ dodatniÄ korelacjÄ. Oznacza to, ĆŒe osoby o wyĆŒszej wadze generalnie spalajÄ wiÄcej kalorii, choÄ zaleĆŒnoĆÄ ta jest sĆaba. Rozrzut punktĂłw wskazuje, ĆŒe na liczbÄ spalonych kalorii mogÄ wpĆywaÄ takĆŒe inne czynniki, takie jak intensywnoĆÄ i rodzaj treningu.
Ćrednia liczba spalonych kalorii dla rĂłĆŒnych typĂłw treningu
Wykres pokazuje, ĆŒe Ćrednia liczba spalonych kalorii jest zbliĆŒona dla wszystkich rodzajĂłw treningĂłw, przy czym HIIT i trening siĆowy spalajÄ nieco wiÄcej kalorii niĆŒ joga i cardio.
Ćrednie spalone kalorie wedĆug pĆci i poziomu doĆwiadczenia
Wykres przedstawia ĆredniÄ liczbÄ spalonych kalorii w zaleĆŒnoĆci od poziomu doĆwiadczenia i pĆci. Wraz ze wzrostem poziomu doĆwiadczenia (od 1 do 3) roĆnie Ćrednia liczba spalonych kalorii dla obu pĆci.
MÄĆŒczyĆșni spalajÄ nieco wiÄcej kalorii niĆŒ kobiety na kaĆŒdym poziomie doĆwiadczenia, przy czym rĂłĆŒnica ta pozostaje niewielka. Na poziomie doĆwiadczenia 3 rĂłĆŒnica jest najbardziej widoczna, co moĆŒe wskazywaÄ na wiÄkszÄ intensywnoĆÄ lub efektywnoĆÄ treningu u bardziej doĆwiadczonych mÄĆŒczyzn. OgĂłlnie trend pokazuje, ĆŒe wiÄksze doĆwiadczenie wiÄ ĆŒe siÄ z wiÄkszÄ liczbÄ spalonych kalorii, niezaleĆŒnie od pĆci.
Ćrednie tÄtno dla rĂłĆŒnych typĂłw treningu
Statystyki opisowe dla Ćredniego tÄtna w zaleĆŒnoĆci od typu treningu
| Statystyka | Yoga | Cardio | HIIT | Trening siĆowy |
|---|---|---|---|---|
| Min | 120 | 120 | 120 | 120 |
| Max | 169 | 169 | 169 | 169 |
| Kwartyl dolny | 132 | 130 | 131 | 132 |
| Mediana | 142 | 141 | 145.5 | 144 |
| Kwartyl gĂłrny | 156 | 155 | 157 | 158 |
| Ćrednia | 143.33 | 143 | 144.44 | 144.24 |
| Odch. std. | 13.97 | 14.32 | 14.74 | 14.4 |
| IQR | 24 | 25 | 26 | 26 |
| Odchylenie Äwiartkowe | 12 | 12.5 | 13 | 13 |
| Odch. std. w % | 0.1 | 0.1 | 0.1 | 0.1 |
| Odch. Äwiartkowe w % | 0.17 | 0.18 | 0.18 | 0.18 |
| SkoĆnoĆÄ | 0.15 | 0.16 | -0.03 | 0.06 |
| Kurtoza | -1.14 | -1.18 | -1.28 | -1.22 |
Wyniki pokazujÄ , ĆŒe Ćrednie tÄtno w rĂłĆŒnych rodzajach treningĂłw (joga, cardio, HIIT, trening siĆowy) jest bardzo zbliĆŒone. Ćrednie wartoĆci oscylujÄ wokĂłĆ 144 uderzeĆ na minutÄ, z minimalnÄ i maksymalnÄ wartoĆciÄ wynoszÄ cÄ 120 i 169. Mediana jest najwyĆŒsza w jodze i treningu siĆowym (144), nieco niĆŒsza w HIIT (143) i cardio (142). Rozproszenie danych, mierzone odchyleniem standardowym, jest rĂłwnieĆŒ podobne, wynoszÄ c okoĆo 14, co wskazuje na umiarkowanÄ zmiennoĆÄ w kaĆŒdej grupie.
RozstÄp miÄdzykwartylowy (IQR) wynosi okoĆo 25 we wszystkich przypadkach, co potwierdza stabilnoĆÄ w centralnej czÄĆci rozkĆadu. RozkĆad danych jest niemal symetryczny (skoĆnoĆÄ bliska 0) i lekko spĆaszczony (kurtoza od -1.21 do -1.27), co oznacza mniejszÄ liczbÄ wartoĆci skrajnych w porĂłwnaniu do rozkĆadu normalnego. OgĂłlnie, wyniki wskazujÄ na podobnÄ intensywnoĆÄ treningowÄ dla wszystkich analizowanych aktywnoĆci w kontekĆcie tÄtna.
ZaleĆŒnoĆÄ tÄtna spoczynkowego od wieku
Do wykresu wstawiono liniÄ trendu wygĆadzonÄ , co pozwoliĆo uchwyciÄ nieliniowe zaleĆŒnoĆci miÄdzy zmiennymi. CieĆ to przedziaĆ ufnoĆci, ktĂłry wskazuje niepewnoĆÄ estymacji linii trendu. Szeroki cieĆ oznacza wiÄkszÄ niepewnoĆÄ w przewidywaniu. Wykres przedstawia zaleĆŒnoĆÄ tÄtna spoczynkowego od wieku. Punkty na wykresie pokazujÄ duĆŒÄ zmiennoĆÄ indywidualnych wartoĆci, jednak trend zaznaczony liniÄ regresji wskazuje, ĆŒe tÄtno spoczynkowe lekko spada do okoĆo 40. roku ĆŒycia, a nastÄpnie nieznacznie wzrasta. OgĂłlnie, tÄtno spoczynkowe utrzymuje siÄ w stabilnym przedziale 60â70 BPM, niezaleĆŒnie od wieku, co sugeruje brak istotnych zmian w zaleĆŒnoĆci od wieku u wiÄkszoĆci osĂłb.
Statystyki opisowe dla tÄtna spoczynkowego w zaleĆŒnoĆci od wieku
| Statystyka | <30 lat | 30-50 lat | >50 lat |
|---|---|---|---|
| Min | 50 | 50 | 50 |
| Max | 74 | 74 | 74 |
| Kwartyl dolny | 56 | 56 | 56 |
| Mediana | 62 | 63 | 62 |
| Kwartyl gĂłrny | 68 | 68.5 | 68 |
| Ćrednia | 62.05 | 62.3 | 62.28 |
| Odch. std. | 7.34 | 7.3 | 7.38 |
| IQR | 12 | 12.5 | 12 |
| Odchylenie Äwiartkowe | 6 | 6.25 | 6 |
| Odch. std. w % | 0.12 | 0.12 | 0.12 |
| Odch. Äwiartkowe w % | 0.19 | 0.2 | 0.19 |
| SkoĆnoĆÄ | 0 | -0.13 | -0.04 |
| Kurtoza | -1.2 | -1.16 | -1.24 |
Wyniki pokazujÄ , ĆŒe tÄtno spoczynkowe w zaleĆŒnoĆci od grupy wiekowej (<30 lat, 30-50 lat, >50 lat) jest stabilne, z niewielkimi rĂłĆŒnicami w Ćrednich wartoĆciach: 62,44 dla osĂłb mĆodszych, 62,1 dla grupy Ćredniej i 62,18 dla osĂłb starszych. WartoĆci minimalne i maksymalne (50 i 74) sÄ identyczne we wszystkich grupach, co wskazuje na spĂłjnoĆÄ w zakresie danych.
Mediana wynosi 62 lub 63, co sugeruje, ĆŒe tÄtno wiÄkszoĆci osĂłb oscyluje w tym przedziale. RozstÄp miÄdzykwartylowy (IQR) i odchylenie Äwiartkowe sÄ zbliĆŒone (odpowiednio 12â13 i 6â6,5), co Ćwiadczy o porĂłwnywalnej zmiennoĆci w kaĆŒdej grupie wiekowej.
RozkĆad danych jest lekko ujemnie skoĆny (-0,06 do -0,1), co oznacza, ĆŒe wartoĆci niĆŒsze od Ćredniej sÄ nieco czÄstsze, a kurtoza (od -1,2 do -1,23) sugeruje spĆaszczony rozkĆad, co wskazuje na mniejszÄ liczbÄ wartoĆci ekstremalnych. OgĂłlnie wyniki pokazujÄ , ĆŒe wiek ma niewielki wpĆyw na tÄtno spoczynkowe.
Czas trwania sesji w zaleĆŒnoĆci od typu treningu
Wykres wiolinowy przedstawia rozkĆad czasu trwania sesji w zaleĆŒnoĆci od rodzaju treningu (joga, cardio, HIIT, trening siĆowy).
NajwiÄksza zmiennoĆÄ czasu trwania widoczna jest w treningu siĆowym i HIIT, gdzie czas trwania sesji jest bardziej zrĂłĆŒnicowany, a wartoĆci rozkĆadajÄ siÄ szeroko w zakresie od okoĆo 0,5 do 2 godzin. Joga i cardio charakteryzujÄ siÄ bardziej skoncentrowanym czasem trwania sesji, ze szczytem w okolicach 1â1,5 godziny.
Ćredni czas trwania treningu dla wszystkich rodzajĂłw treningĂłw oscyluje wokĂłĆ podobnych wartoĆci, jednak rozkĆady pokazujÄ , ĆŒe joga i cardio majÄ mniej skrajnych wartoĆci w porĂłwnaniu do HIIT i treningu siĆowego.
Statystyki opisowe dla trwania sesji w zaleĆŒnoĆci od typu treningu
| Statystyka | Yoga | Cardio | HIIT | Trening siĆowy |
|---|---|---|---|---|
| Min | 0.51 | 0.55 | 0.52 | 0.5 |
| Max | 1.99 | 1.99 | 2 | 1.99 |
| Kwartyl dolny | 1.03 | 1.085 | 1.0275 | 1.0525 |
| Mediana | 1.25 | 1.31 | 1.25 | 1.29 |
| Kwartyl gĂłrny | 1.42 | 1.485 | 1.4425 | 1.4775 |
| Ćrednia | 1.22 | 1.3 | 1.24 | 1.27 |
| Odch. std. | 0.34 | 0.32 | 0.35 | 0.35 |
| IQR | 0.39 | 0.4 | 0.42 | 0.42 |
| Odchylenie Äwiartkowe | 0.19 | 0.2 | 0.21 | 0.21 |
| Odch. std. w % | 0.28 | 0.25 | 0.28 | 0.28 |
| Odch. Äwiartkowe w % | 0.31 | 0.31 | 0.33 | 0.33 |
| SkoĆnoĆÄ | -0.08 | 0.06 | 0.11 | 0.06 |
| Kurtoza | -0.36 | -0.45 | -0.26 | -0.55 |
Wyniki pokazujÄ , ĆŒe czas trwania sesji treningowych jest zbliĆŒony dla wszystkich typĂłw treningĂłw (joga, cardio, HIIT, trening siĆowy). Minimalny czas trwania wynosi okoĆo 0,5 godziny, a maksymalny blisko 2 godzin. Ćredni czas trwania oscyluje miÄdzy 1,23 godziny (cardio) a 1,28 godziny (joga i HIIT), co jest zbliĆŒone do median, ktĂłre rĂłwnieĆŒ wynoszÄ od 1,23 do 1,29 godziny.
RozstÄp miÄdzykwartylowy (IQR) wynosi od 0,39 (cardio) do 0,42 (joga i HIIT), co wskazuje na podobny zakres w centralnej czÄĆci rozkĆadu. Odchylenie standardowe jest rĂłwnieĆŒ porĂłwnywalne (od 0,33 do 0,36), co Ćwiadczy o niewielkiej zmiennoĆci czasu trwania sesji w kaĆŒdej grupie. RozkĆad danych jest niemal symetryczny (skoĆnoĆÄ bliska 0), a kurtoza wskazuje na lekko spĆaszczony rozkĆad (od -0,55 do -0,25). OgĂłlnie, wyniki sugerujÄ , ĆŒe wszystkie typy treningĂłw majÄ podobny czas trwania sesji, z niewielkimi rĂłĆŒnicami w zmiennoĆci i ksztaĆcie rozkĆadu.
CzÄstotliwoĆÄ treningĂłw a czas trwania sesji
Wykres przedstawia zaleĆŒnoĆÄ miÄdzy liczbÄ sesji treningowych w tygodniu a czasem trwania pojedynczej sesji, uwzglÄdniajÄ c poziom doĆwiadczenia uczestnikĂłw.
Wraz ze wzrostem liczby sesji w tygodniu obserwuje siÄ tendencjÄ do wydĆuĆŒania czasu trwania pojedynczej sesji, co wskazuje na wiÄksze zaangaĆŒowanie w trening przy czÄstszej aktywnoĆci. Linia regresji podkreĆla dodatniÄ korelacjÄ miÄdzy tymi zmiennymi.
Kolor punktĂłw, odpowiadajÄ cy poziomowi doĆwiadczenia, wskazuje, ĆŒe osoby bardziej doĆwiadczone (jaĆniejsze punkty) czÄĆciej wykonujÄ dĆuĆŒsze sesje i trenujÄ wiÄcej razy w tygodniu. Wynika z tego, ĆŒe zarĂłwno liczba sesji, jak i czas ich trwania rosnÄ wraz z doĆwiadczeniem.
Procent tkanki tĆuszczowej ciaĆa a czÄstotliwoĆÄ treningĂłw
PowyĆŒszy wykres obrazuje zaleĆŒnoĆci procentu tkanki tĆuszczowej od czÄstotliwoĆci treningĂłw. ZaleĆŒnoĆÄ jest odwrotnie proporcjonalna - im wiÄcej treningĂłw, tym mniejsza tkanka tĆuszczowa dziaĆa.
Statystyki opisowe dla procentu tkanki tĆusczowej w zaleĆŒnoĆci od czÄstotliwoĆÄ treningĂłw
| Statystyka | 2 | 3 | 4 | 5 |
|---|---|---|---|---|
| Min | 20 | 20 | 10 | 10.1 |
| Max | 35 | 35 | 34.9 | 19.8 |
| Kwartyl dolny | 24.8 | 24.7 | 18.625 | 12.4 |
| Mediana | 27.4 | 27.6 | 25.3 | 14.5 |
| Kwartyl gĂłrny | 29.9 | 30.6 | 28.4 | 16.95 |
| Ćrednia | 27.44 | 27.59 | 23.69 | 14.66 |
| Odch. std. | 3.85 | 3.93 | 6.68 | 2.89 |
| IQR | 5.1 | 5.9 | 9.77 | 4.55 |
| Odchylenie Äwiartkowe | 2.55 | 2.95 | 4.89 | 2.27 |
| Odch. std. w % | 0.44 | 0.46 | 0.5 | 0.79 |
| Odch. Äwiartkowe w % | 0.84 | 0.84 | 0.79 | 1.29 |
| SkoĆnoĆÄ | 0.06 | -0.02 | -0.39 | 0.12 |
| Kurtoza | -0.76 | -0.87 | -0.87 | -1.19 |
Na podstawie uzyskanych wynikĂłw moĆŒna stwierdziÄ, ĆŒe wraz ze wzrostem czÄstotliwoĆci treningĂłw spada wartoĆÄ minimalna i maksymalna procentu tkanki tĆuszczowej. Mediana oraz Ćrednia wartoĆÄ jest zdecydowanie najmniejsza dla czÄstotliwoĆci treningĂłw wynoszÄ cej 5 dni w tygodniu. Dla 5 dni najmniejsze sÄ teĆŒ: odchylenie standardowe oraz wartoĆci kwartyli, co pokazuje, jak zostaĆy pogrupowane wartoĆci uzyskane dla tkanki tĆuszczowej. WartoĆci skoĆnoĆci sÄ bliskie zeru, co wskazuje lekkÄ asymetrycznoĆÄ. WystÄpuje zarĂłwno lewostronna (dla 3 i 4 dni w tygodniu), jak i prawostronna (2 i 5) asymetria.